排序方式: 共有93条查询结果,搜索用时 15 毫秒
41.
矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv。该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能。实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速。 相似文献
42.
采用规范不变分子轨道方法,计算了D_2—C_(76)、C_(2v) ̄-和D_3—C_(78)、C_2—C_(82)、D_2—和D_(2d)—C_(84)以及C_2—C_(90)的л电子磁化率。其结果表明这些纯碳原子团簇分子具有较大的抗磁磁化率。反映出这些分子具有一定的芳香性及其л电子有较大的共有化运动程度。 相似文献
43.
44.
提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性.实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良好的适应性,具有接近串行PCA-SIFT算法的图像匹配能力,平均加速比达3.12. 相似文献
45.
提出并实现的一种数据错误快速定位机制(Fast Fault Location Mechanism,FFLM)面向多核处理器存储系统的功能验证,FFLM基于硬件仿真器构建多端口存储器黄金模型,通过在仿真过程中实时监控存储系统与处理器核之间的访存报文,在线比较被测系统访问真实存储器的数据与黄金模型中的对应数据是否一致,在错误数据从存储系统送入处理器核的时刻就能够发现数据错误。与传统方法相比,FFLM具有仿真速度快、硬件资源代价低以及定位错误时间短的优点。对自主设计的CMP-16多核处理器进行仿真时的统计数据表明:使用FFLM后定位数据错误的速度能够比未使用FFLM时平均提高6.5倍。 相似文献
46.
47.
船体分段模块装配工艺决策研究 总被引:2,自引:0,他引:2
针对船体装配工艺设计自动化程度低,影响船舶建造周期和建造质量等问题,设计了分段模块的装配单元决策系统,建立了分段模块装配信息模型,基于模糊数学理论,应用模糊聚类方法实现了分段模块装配工艺的自动编制.实例表明,该方法是合理的和可行的.应用该方法在较高的装配层次上实现了船体模块装配工艺的制定,为船舶模块化生产提供了有效的工具. 相似文献
48.
分析了异常入侵检测存在的问题,研究了基于模糊聚类的入侵检测算法。该算法采用C-均值算法,通过训练数据聚类、异常聚类划分和行为判定等3个步骤实现异常入侵检测。试验采用KDD99数据进行了测试,证明该算法是可行和有效的。 相似文献
49.
50.
针对通用装备保障训练考评的特点,探讨了利用聚类分析法对通用装备保障训练考评成绩区分与排序,并给出了对通用装备保障分队的训练考评成绩进行区分与排序的实例。 相似文献